در عصر شبکه های بی سیم نسل بعدی، برنامه های کاربردی بلادرنگ به تازگی در تحویل اطلاعات، به ویژه در اینترنت اشیا، سیستم های فیزیکی سایبری و اینترنت اشیا صنعتی نیاز دارند. ما بهینه سازی میانگین دیرینگی اطلاعات (AoI) را در یک شبکه mmWave با کمک RIS چند کاربره هدف قرار می دهیم، که در آن حساسیت باندهای mmWave به چالش های انتشار از طریق سطوح بازتابی هوشمند (RIS) کاهش می یابد. قابل ذکر است، مطالعات قبلی بهینه سازی AoI را در شبکه های mmWave تقویت شده با RIS نادیده گرفته اند. مشارکت ما در ابداع یک چارچوب جدید فرآیند تصمیم گیری مارکوف (MDP) و الگوریتم یادگیری تقویت عمیق (DRL) بدون مدل است که برای فضاهای عملی با ابعاد بالا طراحی شده است. رویکرد ما زمان بندی انتقال کاربر، تخصیص توان، شکل دهی پرتو ایستگاه پایه و تنظیمات ضریب بازتابی RIS را هماهنگ می کند. از طریق شبیه سازی های گسترده، برتری روش خود را نسبت به طرح های موجود نشان می دهیم و عملکرد شبکه بهبودیافته را به نمایش می گذاریم. این کار نشان دهنده پیشرفتی در بهینه سازی AoI در زمینه ارتباطات mmWave به کمک RIS است که بر یادگیری سیاست کنترل کارآمد برای بهبود عملکرد شبکه روشن می شود.